AI模型在博弈论测试中展现类人社交技能
研究人员发现,大型语言模型(LLMs)在博弈论框架下展现出复杂的社会推理能力。一项由Eric Schulz博士领导的研究表明,这些AI系统在自利决策方面表现出色,但在协调与团队合作任务中仍有不足。研究团队提出了一种名为“社会链式思维”(SCoT)的新方法,通过引导模型考虑他人视角,显著提升了A...
研究人员发现,大型语言模型(LLMs)在博弈论框架下展现出复杂的社会推理能力。一项由Eric Schulz博士领导的研究表明,这些AI系统在自利决策方面表现出色,但在协调与团队合作任务中仍有不足。研究团队提出了一种名为“社会链式思维”(SCoT)的新方法,通过引导模型考虑他人视角,显著提升了A...
日内瓦大学和伯尔尼大学的研究人员开展了一项开创性研究,发现包括ChatGPT在内的六大主流AI系统在标准情商评估中显著优于人类。AI在应对情绪化场景时的准确率高达82%,而人类仅为56%。此外,ChatGPT-4还能自主生成高质量情商测试,其可靠性与专家设计的测试不相上下。
最新研究揭示,大语言模型(LLMs)与人脑在语言处理方式上存在诸多相似之处,二者均采用下一个词预测和上下文理解机制。研究显示,LLMs在预测神经科学实验结果方面已超越人类专家,但其能效仍远低于人脑。这些发现预示着受大脑启发的计算方式有望彻底变革人工智能的发展。
麻省理工学院(MIT)研究人员发现,广泛应用于医学影像分析的视觉-语言模型(VLMs)无法理解“无”“不是”等否定词。这一关键缺陷可能导致AI系统在按特定标准检索医学影像时出现严重诊断错误。该研究于2025年5月14日发表,并推出了新的评测基准NegBench,以评估和提升AI视觉系统对否定的...
东京大学的研究人员开发出了一套突破性的数字实验室(dLab)系统,实现了薄膜材料合成与评估的全自动化。该系统利用机器学习与机器人技术,无需人工干预即可自主制备样品并进行全面测量。通过标准化数据格式并连接模块化仪器,dLab加速了材料开发进程,让研究人员能够专注于科学发现的创造性工作。
2025年5月8日发表的一项新研究发现,人类对人工智能创造力的感知在很大程度上受到创作过程可见性的影响。阿尔托大学的研究人员通过实验表明,观察AI创作艺术作品的过程能够提升人们对其创造力的评价,这一发现挑战了传统上将创造力仅归因于最终成果的观点。该研究对创意AI系统的设计与评估具有重要意义,有...